تایید هویت با استفاده از پردازش سیگنال گفتار

پایان نامه
  • وزارت علوم، تحقیقات و فناوری - دانشگاه شاهد - دانشکده فنی و مهندسی
  • نویسنده سید مصطفی موسوی بورا
  • استاد راهنما حامد ساجدی
  • تعداد صفحات: ۱۵ صفحه ی اول
  • سال انتشار 1389
چکیده

یکی از روشهای تأیید و تعیین هویّت افراد، استفاده از صدای فرد می باشد که مقوله شناسایی گوینده و تصدیق و تعیین هویت گوینده نام دارد. از جمله روشهایی که در پردازش گفتار و بطور خاص در شناسایی گوینده کارآیی بسیار خوبی از خود نشان داده است، مدل چندی سازی برداری و مدل شبکه عصبی می باشد که وسیله ای بسیار قوی برای مدل کردن سیگنال های تصادفی و ایستا می باشند. در این پروژه ما از مدل چندی سازی برداری و هم از مدل شبکه عصبی از نوع پرسپترون چند لایه برای تصدیق و تعیین هویت گوینده های از روستای بالابورا از توابع منطقه بندپی غربی شهرستان بابل که می توانند به سه زبان انگلیسی،فارسی و زبان مازندرانی(مازنی) صحبت کنند، بکار گرفته شده است. با توجه به تمهیدات بکار گرفته شده در این پروژه، بر روی سه پایگاه داده از ارقام برای هر سه زبان متشکل از 20 نفر (12 مرد و 8زن) که در سنین مختلف 12 تا 61 سال بوده اند و ارقام صفر تا نُه را بیان کرده اند، کارآیی سیستم شناسایی گوینده طراحی شده در این پروژه برای تعیین هویت گوینده در هر کدام از این سه زبان مشخص شده است. بطوریکه نتایج حاصل نشان می دهد که درصد شناسایی این سیستم توسط این دو روش در هر سه زبان متفاوت بوده، بطوریکه در مرحله اول دقت سیستم توسط روش vq تأیید گوینده به زبانهای انگلیسی، فارسی و مازنی بترتیب با 26mfcc برابر با 94.7 %، 92.6 % و 91.3 % شده است که در مرحله دوم با استفاده از یک نوع شبکه عصبی پیشنهادی توسط26lpcc بترتیب برابر با 99.6%، 98.7% و 97.9% بهبود یافته است. در مراحل مختلف این پروژه تأثیر تعداد دفعات ارائه داده های آموزشی به شبکه عصبی، تاثیر تعداد ویژگیها و نوع ویژگی از نقطه نظر ایستا و گذرا بودن و نیز تاثیر ایجاد تغییرات در پارامترهای یادگیری شبکه، مورد بررسی قرار گرفت. همچنین طی آزمایشهایی کارائی سیستم تصدیق هویت پیشنهاد شده ارزیابی و نتایج حاصل از بازشناسی ارقام و تصدیق هویت با استفاده از روشهای گفته شده با نتایج حاصل از روش کلاسیک چندی سازی برداری مقایسه گردید.

۱۵ صفحه ی اول

برای دانلود 15 صفحه اول باید عضویت طلایی داشته باشید

اگر عضو سایت هستید لطفا وارد حساب کاربری خود شوید

منابع مشابه

شناسایی گفتار پرخیشومی مبتنی بر پردازش سیگنال گفتار

پرخیشومی از رایج ترین اختلالات در کودکان دارای شکاف کام است. عموماً برای کاهش این نقیصه نیاز به عمل های جراحی است و بنابراین ارزیابی خیشومی بودن برای بررسی تأثیر عمل های جراحی و همچنین طراحی جلسات گفتاردرمانی که بعد از عمل های جراحی نیاز است، حیاتی می باشد. مدل های تمام قطب مانند ar برای مدل سازی سیستم لوله صوتی افراد دارای شکاف کام به دلیل صفرهایی که در پاسخ فرکانسی فیلتر لوله صوتی این افراد ظا...

شناسایی خسارت با هزینه کم پلهای کابلی با استفاده از پردازش سیگنال و فراگیری ماشین

امروزه با کمک روشهای پایش سلامت سازه ها می توان وقوع خسارت را در همان مراحل اولیه شناسایی کرد و از وقوع خسارت های مالی و جانی جلوگیری کرد. با این حال یکی از موانع بر سر راه متداول شدن این روشها در کشور گران قیمت بودن سیستمهای پایش سلامت است. هدف از این پژوهش ارائه یک روش شناسایی خسارت با هزینه کم برای پل ها با استفاده از تکنیک های پردازش سیگنال و فراگیری ماشین است. جهت کاهش هزینه ها تعداد سنسور...

متن کامل

شناسایی خسارت در سازه با استفاده از پردازش سیگنال و شبکه های عصبی مصنوعی

در طول دو دهه اخیر بحث شناسایی خرابی و پایش سلامت سازه ها با هدف کاهش هزینه نگهداری و بهبود ایمنی و قابلیت اطمینان سازه مورد توجه قرار گرفته است. پس از وقوع زلزله با توجه به وضعیت بحرانی موجود و تعداد زیاد سازه های بلند مرتبه امکان مراجعه حضوری به تک تک سازه ها وجود ندارد. این موضوع اهمیت توسعه روش هایی که بتوانند تنها با استفاده از سیگنال های پاسخ ثبت شده در مدت زمان زلزله، خسارت ایجاد شده در ...

متن کامل

تشخیص جنسیت با استفاده از سیگنال گفتار

تشخیص جنسیت با استفاده از سیگنال گفتار احمد عطاران چکیده: طبقه بندیجنسیت درگفتار و بازشناسی گوینده به اندازه طبقه بندی احساسات گفتار مفید است زیرا هنگامی که مدلهای صوتی(آکوستیک) جداگانه برای مردان و زنان به کارگرفته شود کارایی بهتری خواهد داشت. با توجه به اینکه سکوت بین زن و مرد مشترک است بنا بر این سکوت از ابتدا حذف می گردد. این امر باعث کاهش حجم بار محاسباتی اضافی و همچنین افزای...

تشخیص احساسات از سیگنال های گفتار براساس روش های فیلتر

گفتار ابزار اولیه ارتباط بین انسان‌‌ می‌باشد. با افزایش تراکنش میان انسان و ماشین نیاز به محاوره خودکار این دو و حذف کاربر انسانی مورد توجه قرار گرفته است.هدف از انجام این تحقیق، تعیین یک مجموعه از ویژگی‌های تاثیر گذار در تشخیص احساسات مبتنی بر سیگنال صحبت می‌باشد. در این مقاله، سیستمی طراحی گردید که شامل سه بخش اصلی، استخراج ویژگی، انتخاب ویژگی و طبقه‌بندی می‌باشد. پس از استخراج ویژگی‌های پرکا...

متن کامل

منابع من

با ذخیره ی این منبع در منابع من، دسترسی به آن را برای استفاده های بعدی آسان تر کنید

ذخیره در منابع من قبلا به منابع من ذحیره شده

{@ msg_add @}


نوع سند: پایان نامه

وزارت علوم، تحقیقات و فناوری - دانشگاه شاهد - دانشکده فنی و مهندسی

کلمات کلیدی

میزبانی شده توسط پلتفرم ابری doprax.com

copyright © 2015-2023